Ha главную страницу второго семестра

Глобальное и локальное выравнивание анинокислотных последовательностей

Матрицы переходов

Глобальное выравнивание

  • Матрица переходов строилась для последовательностей MIGR (первые четыре а.о. белка RUVA_ECOLI) и MMLGT (полученной из первой путем двух замен и одной вставки);
  • При построении матрицы перехода использовались следующие параметры:
    • Вес совпадения равен 2;
    • Вес замены равен -1;
    • Штраф за делецию равен -2;
  • Вес оптимального пути равен 1. Полученное значение не велико, т.к. вероятность происхождения на столь коротком участке белка (4 а.о.) необходимого количества мутаций чрезвычайно мала.
  • Выравнивание, соответствующее оптимальному пути:

Локальное выравнивание

  • Матрица переходов строилась для последовательности из первых 9 аминокислотных остатков белка RUVA_ECOLI) и IGGII.
  • При построении матрицы перехода использовались следующие параметры:
    • Вес совпадения равен 2;
    • Вес замены равен -1;
    • Штраф за делецию равен -2;
  • Вес оптимального пути равен 6;
  • Вес субоптимального пути равен 4;
Оптимальное выравнивание:
GII
|||
GII
Субоптимальное выравнивание:
IG
||
IG

Влияние параметров на глобальное выравнивание

При построении глобального выравнивания программа NEEDLE из програмного пакета EMBOSS учитывает аффинную систему штрафов за открытие и продолжение делеций в выравниваемых последовательностях.

Приведенное ниже выравнивание, построенное программой NEEDLE при стандартных параметрах цены открытия и продолжения гэпа, отражает тот случай, когда не желательны и очень длинные, и короткие делеции.

Выравнивание строилось со следующими параметрами:

  • Цена за открытие гэпа (делеции) — 10;
  • Цена за продолжение гэпа (делеции) — 1.
RUVA_ECOLI         1 MIGRLRGIIIEKQPPLVLIEVGGVGYEVHMPMTCFYELPEAGQEAIVFTH     50
                                                                       
NEW_SEQ            1                                                         0

RUVA_ECOLI        51 FVVREDAQLLYGFNNKQERTLFKELIKTNGVGPKLALAILSGMSAQQFVN    100
                                                                       
NEW_SEQ            1                                                         0

RUVA_ECOLI       101 AVEREEVGALVKLPGIGKKTAERLIVEMKD---RFKGLHGDLFTPAADLV    147
                                            :|..::.   ||||||||||||     
NEW_SEQ            1                        MIGRLRGIIIRFKGLHGDLFTP          22

RUVA_ECOLI       148 LTSPASPATDDAEQEAVAALVALGYKPQEASRMVSKIARPDASSETLIRE    197
                                                                       
NEW_SEQ           23                                                        22

RUVA_ECOLI       198 ALRAAL    203
                           
NEW_SEQ           23            22

Второе выравнивание строилось при условии, что штаф за открытие и продолжение делеции равны, а также сам штраф гораздо меньше, чем в предыдущем выравнивании. При задании таких параматров программа увеличивает число гэпов внутри последовательности, чтобы увеличить число совпадений аминокислот.

Выравнивание строилось со следующими параметрами:

  • Цена за открытие гэпа (делеции) — 1;
  • Цена за продолжение гэпа (делеции) — 1.
RUVA_ECOLI         1 MIGRLRGIIIEKQPPLVLIEVGGVGYEVHMPMTCFYELPEAGQEAIVFTH     50
                                                                       
NEW_SEQ            1                                                         0

RUVA_ECOLI        51 FVVREDAQLLYGFNNKQERTLFKELIKTNGVGPKLALAILSGMSAQQFVN    100
                                                                       
NEW_SEQ            1                                                         0

RUVA_ECOLI       101 AVEREEVGALVKLPGIGKKTAERL--IVEMKDRFKGLHGDLFTPAADLVL    148
                                 :  ||     ||  |: :  ||||||||||||      
NEW_SEQ            1             M--IG-----RLRGII-I--RFKGLHGDLFTP           22

RUVA_ECOLI       149 TSPASPATDDAEQEAVAALVALGYKPQEASRMVSKIARPDASSETLIREA    198
                                                                       
NEW_SEQ           23                                                        22

RUVA_ECOLI       199 LRAAL    203
                          
NEW_SEQ           23           22

Сравнив полученные выравнивания, можно отметить, что первое оказалось более объективным. Последовательность NEWSEQ была получена склеиванием двух небольших участков последовательности исходного белка, а не вырезанием из нее мелких фрагментов с образованием небольших и многочисленных делеций.

Однако следует учесть, что ни одно из них не соответствует действительности.Для того, чтобы получить реальную картину, необходимо увеличить штраф за открытие гепа и уменьшить — за его продолжение. Приведенные выравнивания позволяют оценить преимущества аффинной системы штрафов.


© Yuminova Alina aka Melli, 2005